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Miantenaussprache durch einen S^ynthesizer 

Die vorliegende Brfindung betrif ft eine Text-zu-Sprache-lfei- 
setztzng durch edLnen Coinputer, und insbesondere das korrekte 
Aussprechen von echten Kamsa von Text. 

Die. N^menaxiasprache kann au£ dem Gebiet des AuSendienstes 
izmerhalb der T^lefonindustrie \znd der Conputerindixstrie 
verwendet werden. Sie wird auch in grOSeren Firmen gefunden, 
die eine inngekehrte Verzeichnis-Hilfe (Ntixnmer zu Name) haben, 
imd auch in Text-NachrichtenQystemen verwendet, wo das letzte 
Namensfeld eine gemainsaxoa Einheit ist. 

Bs gibt viele Qerflter die kommerziell erhaitlich sind und die 
anierikanisched Bngliscb ala Sprache durch Cdvuter syntheti- 
sieren* Eine der fOr die Sprach-^ynthese gesuchten 
Funktionen, die spezielle Probleme aufweist, ist die Ausspra- 
Che einer unbegrenzten Anzahl von ethnisch unterschiedlichen 
Kacfanamen. Aufgrund der extrem grofien Anzahl von unterschied- 
lichen Nachnamen in einem ethnisch diversifizierten Land wie 
die Vereinigten Staaten kazm die Aussprache eines Nachnamens 
unter Verwend\mg anderer ^rachausgangstechnologien wie zuxn 
Beispiel Audioband oder digital gespeidherter Sprache 
momezitan praktisch nicht realisiert werden. 

Es gibt typlscherweise eine uxngekehrte Relation zwischen der 
Atasspradhegenauigkeit eines SpracOtisynthesizers in seiner 
Quellensprache und der Aussprachegenauigkeit des gleichen 
Synthesizers in einer zweiten Sfprache. Die Vereinigten Staa- 
ten sind ein ethniscdi heterogenes \md diversifiziertes Land 
mit Namen, die von Sprachen abgeleitet sind, die von den 
gemeinsamen indo-exiropaischen SpracOien wie zum Beiapiel Fran- 
zOsisch, Italiexiisch, Polnisch, Spanisch, Deutsch, Irisch 
uaw. bis hin zu exotischeren Qpacachen wie zum Beispiel 
Japaniscai, Axmenisch, Chinesiscto, Arabiach und Vietnamesisch 
reichen. Die Aussprache von Nachnamen von den verachiedenen 
ethnischen Gruppen stimmt nicht mit den Regeln des 



standa rt isierten anerikani^phen Exi9lisch tSLoerein. Zum 
Baispiel werden die meisten deutschen Naxnen auf der ersten 
Silbe betont, wohingegen japanische und spanische Namen dazu 
neigen, auf der vorletzten betont zu werden, xind £ranzOsische 
S Naxnen eine endatAndige Betonung taaben. Ahnlich wird die 

orthograpliische Seqpxenz CH als [c] in englischen N&unen (z,B. 
CHILDERS), als [X] in f ranzOsxBChen Naxnen wie z«B. 
CUARPENTIER, und als [kl ±n italienischen Namen wie z.B« 
BRONCHETTI ausgesproch^. Menscfaliche Siprecher erzeugen oft 

10 die richtige Aussprache durch "Wissen" der TTrsprungs-Spxrache 
des Naxnens. Das Problem, das durch einen Sprachsynthesizer 
gegeben ist, besteht ixn ^rechen dieser N^unen unter 
Veintfendung der ricbtigen Aussprache, denn da Coznputer nicbt 
den etbniscdien Ursprung des N&xnens 'wissen*, ist die 

IS Aussprache oft falsch. 

Bin System ist im Stand der Tecfanik vorgeschlagen worden, in 
dem ein Name zuerst mit einer Anzahl von BintrAgen in einem 
Verzeichnis verglichen wird, das die bekanntesten Naxnen aus 

20 einer Anzahl von unterschiedlichen SprachgruK>pen enthAlt* 

Jeder Verzeichnis -Bintx^g enthait eine oirtJiographische Form 
und ein phonetisdhes Aqoivalent. Wenn eine Obereinstimaning 
auftritt, wiird das phonetiscOie Aquivalent zu einem 
Synthesizer gesendet, der es in eine hdrbare Aussprache fOr 

25 diesen N^mien umsetzt. 

Wenn der Name nicht im Verzeichnis gefunden wird, verwendet ' 
das vorgeschlagene System ein statistisches Tr igraxnm-Modell . 
Diese Trigraxnm-Analyse uxnfaSt das Bxanitteln einer 

30 tfethrscheinlichkeit dafOr, daS jeweila eine Drei-Buchstaben- 

Folge (Oder ein Trigramm) in einem Namen mit einer Btyxaologie 
verbunden ist* Wenn das Programm ein neues Wort empfangen 
hat, wurde eine statist ische Forxnel angewendet, um fctr jede 
Btymologie eine Wahrscheini ichkeit zu ermitteln, die auf 

35 deder der Drei-Buchstaben-Folgen (Trigraxmne) in dem Wort 
basiexrt* 

Das Problem bei dieser LOsung ist die Genauigkeit der Tri- 
graxmn-Axxalyse. Das liegt daran, da£ die TTigraxom-Analyse nur 



elne Wahrscheinllchkelt bearpchnet, ,4jnd* wen|> aile Sprachgrup- 
pen als mdglicher Kandidat fOr die Uraprungs-Sprachgruppe ei- 
nes Wbrtes betrachtet werden, ist die Genauigkeit der Auswahl 
der Ursprungs-Sprachgruppe des Wortes nicht so hoch, als wenn 
5 weniger lodgliche Ksuididaten vorhanden sind« 

GemaS einem Aspekt der vorliegeoden Brfindung wird ein Ver- 
fahren zum positiven Zdenti£izieren Oder Bliminieren einer 
^raciigruppe als eine Urspnmgs-Spradignqnpe fOr ein gegebe- 

10 nes Wort gesctaaffen, wobei das Verfahren aufweist: 
Vergleichen von Unterketten aixs Graphemen eines 
Eingangswortea mit einem gespeicherten Satz von Filterregeln, 
bis entweder eine Obereinstimming einer der Unterketten nit 
einer der Filterregeln positlv eine Sprachgruppe 

15 identifiziert oder bis irgendeine S^rachgrtq^pe eliminiert 
wird# wenn eine ttbereinstinsnung einer der Ukiterkettai mit 
einer der Filterregeln anzeigt, daS eine Sprachgruppe von der 
Betrachtung als eine Ursprxings-Sprachgruiqpe £ar das Bin- 
gangswort eliminiert wird; und 

20 Brzeugen einer Lists xnOglicber, nicht eliminierter Ursprungs- 
Sprachgzuppen, wenn keine Sprachgruppe positiv als die 
Ursprungs-Sprachgrtippe identifiziert wird, Oder anzeigen der 
Urspnmgs-Sprachgruppar wenn die Ursprungs-Sprachgrus^e 
positiv identifiziert wird. 

25 

GemaS einem anderen Aspekt der vorliegenden Brfindung wird 
ein Verfahren zvm Brzeugen korrekter Phoneme for ein eingege- 
benes Eingangswort gemaS einer Sprachgruppe von UrsprQngen 
des Eingangsworts geschaffen, wobei das Verf eOiren aufweist: 
30 Filtem des Bingangsworts in einem Filter, im eine Uraprungs- 
Sprachgruppe fOr das Eingangswort zu identifizieren oder urn 
zumindest eine Ursprungs-Qprachgruppe fOr das Eingangswort zu 
eliminieren; 

Sencten des Eingangsworts und einer Sprach-Konnzeichnung, die 
55 eine Ursprungs-gprachgriflBpe fOr das Eingangswort anzeigt, von 
dCTi Filter zu einem Buchstabe-zu-Xlang-Modul, der Buchstabe 
zu Klangregeln enthalt, wenn der Filter positiv eine Ur- 
sprungs-Sprachgruppe far das Eingangswort idaatifiziert; 



Senden des Bingangsworts usul jeder ^nicAit eliininlerten Sprach- 
gruppe von dem Filter aus zu elnem Graphen-Analyslerer, wexm 
elne nrsprungs^Spracfagruppe far das Bingangswort nlcht posl- 
tiv durch den Filter identlflzlert wlrd; 
5 Brzeugen elner wahrschelnllchsten Ursprungs-Sprachgruppe fdr 
das Bingangswort, Indem Grapheme In dem Bingangswort analy- 
slert werden; 

Senden des Elngangswortes und der wahrschelnllchsten Ur- 
Qprungs-Sprachgrunpe zu elnem tJtatersatz des Buchstabe-zu- 
10 Klang-Moduls entsprechend der wahrschelnllchsten Slprach- 
gruppe; 

Brzeugen von segxnentartlgen Phonemen £Qr das Bingangswort. In 
dem Untersatz des Buchstabe-zu-Klang-Modxxls; 
Sen d e n der segmentartlgen Phoneme imd Sprach*Kennzelchnung 
15 von dem Buchstabe-zu-Klang-Kodul zu elnem Betonxmgs-Zuord- 
nungsabschnltt ; 

Brzeugen elner Betonungs-Zuordntmgs-Znformatlon fOr das Bin- 
gangswort In dem Betonungs-Zuordnungsabschnltt; iznd 
Senden der segmentartlgen Phoneme xmd der Betonungs-Zuord- 
20 niAgs-In£ormatlon zu elner S^rachreallslerungpelnhelt • 

GeroftS dlesem Aspekt wlrd auch elne Vorrlchtung zvm posltlven 
Identi£lzleren oder Bllmlnleren elner Sprachgruppe als elne 
Uzisprungs-Sprachgruppe £Qr eln gegebenes Wbrt gescha££en, die 
25 au£welst : 

elnen Fllterregel-Spelcher, der elnen Satz mlt Fllterregeln 
spelchert, wobel eln erster Untersatz der Fllterregeln posl- 
tlv elne ^prachgrtqppe ldentl£lzlert und wbbel eln zwelter 
Untersatz der Fllterregeln elne Sprachgrvtppe ellmlnlert; 

30 elnen Verglelcher, der Iftiterketten der Gra^eme elnes Bin- 
gangswort s mlt dem ersten Untersatz und dem zwelten Untersatz 
der Fllterregeln verglelcht, bis elne Oberelnstlmmung elner 
der Uaterketten mlt elner des ersten Untersatzes von Fllter- 
regeln posltiv elne Sprachginippe identl£lzlert oder elne 

35 Sprachgruppe ellmlnlert, wenn elne Oberelnstitnmiing elner der 
Unterketten mlt elner des zwelten Utitersatzes der Fllterre- 
geln anzeigt, daS elne i^rachgruppe von der Betrachtiug als 
elne Urqprungs-^rachgruppe tHr das Bingangswort ellmlnlert 
Ist; und 



einezi Ausgang, der eine Litite mOglicher Urpprungs-Sprachgrup- 
pen erzeugt, wenn keine Sprachgrtappe als nrapnmgs-Sprach- 
gruppe positiv identif iziert wird, und der eine Anzeige der 
Ursprungs-Sprachgruppe erzeugt, wenn die Ursprungs-Sprach- 
gruppe positiv identi£iziert wird* 

Die vorliegende Erfindung Idst das obenstehende Problem, in- 
dem sie die Genauigkeit der "nrigraiim-^Analyse verbessert. Dies 
wird bewerkstelligt/ indem ein Filter bereitgestellt wird, 
der entweder positiv eine Sprachgruppe als eine Urspnings- 
Sprachgruppe identifiziert, Oder der eine Sprachgruppe als 
eine Ursprungs-Sprachgruppe fOr ein gegebenes Eingangswort 
eliminiert. Das Filterxingsverfaliren gemafi der vorliegenden 
Brfindung umfagt das Identifizieren Oder Elixninieren einer 
Sfprachgruppe als eine nrsprung8-Sprachgn:Q>pe £ar ein 
Eingangswort gemas einem gespeicherten Satz von Filterregeln* 
Der Schritt des Identif izierens oder Eliminierezis einer 
Sprachgaruppe enthAlt das DurchftUiren einer ersch6pf enden 
Durchsuche des Regelsatzes, indem eine Rechts nach Links- 
Abtastung verwendet wird. Die Sprachgruppen warden 
eliminiert, wenn eine Obereinstinmiung einer dieser 
Unterketten mit einer der Filterregeln anzeigt, daS eine 
Sprad^rux^ von der Betrachtung als Ursprungs-Spracligruppe 
£ar das Eingangswort el im iniert werden sollte. Dies wird 
ausgeftUirt, bis eine Obereinstiinraung einer der Unterketten 
mit einer der Regeln positiv eine Sprachgruppe identifiziert . 
Wenn keine Sprachgruppe positiv als eine Ursprungs- 
SptadhgrujpspB identif iziert wird, nachdem alle Unterketten fUr 
ein gegebenes Eingangswort verglichen wurden, wird eine Ziiste 
mOglicher Ursprungs-Qprachgrqppen aufgestellt. Dieses 
Filterverfahren erzeugt a;ich eine positiv identif izierte 
Sprachgruppe des Originals , wenn eine positive Identifikation 
gegeben ist. 

Die Vorteile des Verwendens elnes Filters vor der Trigramm- 
Analyse enthalten das Vermeiden unnOtiger Trigramm-Analyse, 
wenn Filterregeln positiv eine Sprachgruqnpe als Ursprungs- 
Sprachgruppe identifizieren kdnnen. Wenn keine Qprachgruppe 
positiv identif iziert werden kann, reduziert das 
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Fllterungsverfahren die Andarungea.einer Inkorrelcten Annahme, 
die bei der Trigraxoa-Analyse genacht wird, indem die Anzahl 
der ns^glichen in Betracht kosnatienden Sprachgruppen als 
Urspnings-Sprachgruppe reduziert wird. Durch die Eliminierung 
einiger SSprachgruppen ist die Xdentif ikation einer Ursprungs* 
SpraGhgruK>e genauer, wie obenstehend dielcutiert wurde« 

Die Er£indung ezithAlt auch eih Verf ahren zum Brzeugen korrek- 
ter PhonezDe £€br ein gegebenes Bingangawort gemftS der Ur- 
sprungs-Sprachgrusipe des Eingangsworts • Dieses Verfahren um- 
faSt das Durchsuclien eines Verzeichnissea nach einem Eintrag, 
der einem Bingangsviort eatspricht, wobei jeder Sintrag ein 
Wort und Vtooneane far dieses Wort enth&lt« Dieser Eintrag wird 
dann zu einer Sprachrealisierungseinheit £llr Aussprache ge- 
sendet« wenn die Verzeidmis-Durchsuchung einen Eintrag auf- 
deckt, der d^ Eingangswort entspricht. Das Eingangswort wird 
zu einem Filter gesendet, wenn das Eingangswort niclit einen 
entsprechenden Eintrag in dem Verzeichnis hat. 

Der nAchste Schritt beim Verfahren umfaSt das Filtem, um ei- 
ne Ursprungs-Sprachgruppe fflr das Eingangswort zu identifi- 
zieren Oder tm zumindest eine Ihrsprungs-S^rachgruppe for das 
Eingangswort zu eliminieren. Wenn der Filter posit iv eine Ur- 
sprungs-Sprachgruroe ftlr das Eingangswort identifiziert, war- 
den das Eingangswort und ein Sprach-Kennzeichen^ das eine Ur- 
sprungs-Sprachgruppe f^Yr das Eingangswort angibt, von dem 
Filter aus zu einem Buchstabe-zu-Klang-Modul gesendet. Wenn 
eine Ursprungs-Sprachgruppe nlttit positiv durch den Filter 
identifiziert wird, werden das Eingangswort und alle Sprach- 
gruppen, die nicht eliminiert wurden, vcm dem Filter aus zu 
einem ^igramm-Analysierer gesendet. 

Die am meisten wahrscheinliche Urspnmgs-Sprachgruppe fOr das 
Eingangswort wird erzeugt^ indem Trigramme analysiert werden, 
die in dem Eingangswort au£treten* Dieae am meisten wahr- 
scheinliche Ursprungs-Sprachgruppe, die durch die Trigramm- 
Analyse erzexigt wird, wird zusammen mit dem Eingangswort zu 
einem Untersatz von Buchstaben-zu-Klang-Regeln gesendet, die 
mit der wahrscheinlichsten Sprachgrvgppe korrespondieren. Pho- 
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neme werden ftr das Bingangawort ?9knAfi-deiq.^tsprechenden Un^ 
tersatz der Buchstabe-zu-Klang*Regeln erzeugt. 

Die Erf indung erstreckt slcb in alien Punkten auch auf ein 
5 Verfahren iind eine Vorrichtxing zur Sprach-synthese, die die 
obenstehenden Merkmale umfafit* Die Sprach-^yntliese ]cann eine 
St)rach-*Reali8ierung enthalten, die dafOr ausgelegt ist, das 
Wdrt gemaS der bestizomten Stprache auszusprechen. 

10 Das XBM. TECHNICAL DISCLOSXJRB BULLETIN, Vol. 27, Nt. 7A, De- 
zeniber 1984, Seite 3681, New York, US; P.S* COHEN usw. : 
"Method for iiqproving spelling-to-soimd rules for speech 
synthesis using algoribhmically deduced etymologies" off en- 
bart ein Verfahren, das eine positive Jdmtif ikation verwen- 

IS det« 

Die vorliegende Brfindung kann auf verschiedene Arten in die 
Praxis umgesetzt werden, wobei eine von -i^m^TH nachfolgend 
beispielhaft xnit Bezug auf die beiliegenden Zeichnimgen be- 
20 schrieben wird, in denen: 

Figur 1 ein logxsches Blockdiagraum der 

Sprachidentlfikations- und der Phonem-Reallsierungs-Mbdule 
illustriert; und 

25 

Figur 2 ein logisches Blockdiagraxmn eines N^men-Analyse-^- 
stems zeigt, das den Sprachgrrqppenidentifikations- und Pho- 
nem-Realisierungs-Modul der Figur 1 enthdlt und in Oberein- 
stimmung mit der vorliegenden Brfindung aufgebaut ist. 

30 

Figur 1 ist ein Diagraram, das verschiedene Logikbldcke der 
vorliegenden Brfindung illustriert. Die physikalische Ausftih- 
rungsform des Systems kann durch einen kcanmerziell erhaitli- 
chen Prozessor realisiert werden, der logisch wie gezeigt 
3S ausgelegt ist« 

Bin Name, der ausgesparochen werden soil, wird als Bingang an- 
genonnen* Das Suchen wird innerhalb von BintrAgen in einem 
Verzeichnis 10 fOr diesen Bingangsnamen ausgefohrt. Jeder 



Verzeichnis-Bintrag hat einen Naxnen- and Fhoneiae fOr diesen 
Nanien« Bin semantlsches Zeichen ldexiti£iziert das Wort als 
Naxnaxi. 

5 Eine Durchsuchung fOr einen Bingangsnamen, der einem Eintrag 
in dem Verzeichnis 10 entspricht, resultiert in einem Tref- 
fer. Das Verzeichnis 10 sendet dann sofort den Eintrag (Name 
und Phioneme} zu einer Qprachrealisierungseinheit 50, die den 
Neman gemAS den Phonemen ausspricht, die in dem Eintrag ent- 
10 halt en sind. Der Aussprachevorgang tUx dieses Bingahgswort 
wQxde daim abgeschlossen sein. 

Ein Verzeichnis-Fehlgriff (dictionary miss) tritt auf, wenn 
es keinen entsprechenden Eintrag fUr den Eingangsnamen in dem 

15 Verzeichnis 10 gibt. Vm die richtige Aussprache 

bereitzustellen, versucht das system, die Urspsrungs- 
Sprachgruppe des Eingangsnamans zu identifizieren. Dies wird 
ausgeflUirt, indem einem Filter 12 der Eingangsname zugesendet 
wird, der in dem Verzeichnis 10 fehlt. Der Eingangsname wird 

20 durch den Filter 12 analysiert, ma entweder positiv eine 
Sprachgruppe zu identi£izieren Oder urn bestimmte 
Spra^gruppen von der weiteren Betrachtung auszuschlieSen. 

Der Filter 12 arbeitet, um $prachgruppen fOr Eingangsnamen 
25 auf der Basis eines vorgegebenen Regelsatzes auszufiltem. 

Die Regain werden dem Filter 12 von einem Regel-Speicher, der 
spater beschrieben wird, bereitgestellt. 

Jeder Eingangsname wird betrachtet, als aus einer Kette von 
30 Graphe m en zusammengesetzt zu sein. Einige Ketten innerhalb 
eines Eingangsnamens identifizieren (Oder eliminieren) 
eindeutig eine Sprachgruppe fGr diesen Namen. Zum Beispiel 
identifiziert gemafi einer Kegel die Kette BAUM positiv den 
Eingangsnamen als deutsch (z.B. TANNENBAUH) . GemaS einer 
35 anderen Kegel identifiziert die Kette MOTO am Bnde eines 
Naroens positiv die Sprachgruppe als :japanisch (z.B. 
KAWAMOTO) • Wenn es eine seiche positive Identifikation gibt, 
vierden der Eingangsname und die identif izierte Sprachgruppe 
(Ii TAG) direkt zum Buchstabe*zu-Klang-Abschnitt 20 gesendet/ 



der die geeigneten Phoneme ^er Spracbreali^-ieruxigseixiheit 50 
zur Ver£tlgung stellt. 

Der Filter 12 veraucht ansonsten, so viele Sprachgruppen wie 
5 xn&glich von der weiteren Betrachtung zu elizninieren, wexm ei- 
ne positive Xdentifikation nicht mdglich ist. Dies erhdht die 
Wahrscheinlichkeitsgenauigkeit der verbleibenden Analyse des 
Eingangsnamens. Zim Beiopiel liefert eine Filterregel/ dafi, 
wenp die Kette -B am Ende eines Naioens ist, Kaxnensgruppen wie 
10 zvm Beispiel Japaniscli, Slawisch, Franzdsiscli, Spaniach xmdL 
Irisch von einer weiteren Betrachttrng elizniniert werden 
kdzmen. Durcli diese Bliminierung wird die nachfolgende 
Analyse zum Bestiamen der Ursprungs-^rachgruppe fUr einen 
Eingangsnanien, der nicht positiv identifiziert wird, verein- 
IS £acht land verbessert. 

Unter der Annahzne, dafi keine Sprachgruppe positiv als die 
Ursprungs-Sprachgruppe durch den Filter 12 bestimmt werden 
kann, ist eine weitere Analyse notwendig. Diese wird diirch 

20 den Trigramm-Analysierer 14 durchgefflhrt, der den 

Bingemgsnamen xmd die liiste aller Sprachgruppen ezcpfangt, die 
nicht durch den Filter 12 eliminiert wurd«x« Der Trigrazmn- 
AJialysierer 14 analysiert die Kette aus Graphemen (den 
Eingangsnamen) syntaktisch in OT^igraznmen, die Graphem-Ketten 

75 sind, die drei Grapheme lang sind. Zum Beispiel wird die 
Graphem-Kette # SMITH # in den folgenden fOnf Trigramme 
syntaktisch analysiert: * SM, SMI, MIT, ITH, TH » . Ftlr die 
Trigramok-Analyse wird das Zwischenzeichen (Wortgrenze) als 
Graphem betrachtet* Deshalb ist die Anzahl der Trigramme 

30 izEBner die gleiche wie die Anzahl der Grapheme im Namen. 

Die Wahrscheinlichkeit fOr jedes der Trigramme daftlr, daS es 
von einer bestimraten Sprachgruppe ist, wird dem Trigramm- 
Analysierer 14 eingegeben. Diese Wahrscheinlichkeit, die 
35 durch eine Analyse einer Mamendatenbank berechnet wird, wird 
als ein Eingang von einer Hau£igkeitstabelle aus Trigrammen 
for jede S^racOigruppe empfangen, die xxltOit durch den Filter 
12 eliminiert wurde. Das Gleiche wird audh fOr jedes der 
anderen nrigraxmne der Gra^em-Kette ausgefOhrt, 



Die xiach£olgende (tellwelse) Matrix zeigt Proben-Wahrschein- 
lichkeiten fOr den Nachnamen VlTAL&z 





Li 


Lj 


Ln 


#VI 


,0679 


,4659 


,2093 


VIT. 


,0263 


,4145 


,0000 


ZHA 


,0490 


,7851 


,0564 


TMi 


,1013 


,4422 


,2384 


ALB 


,0867 


,2602 


,2892 


LB« 


,1884 


,3181 


,0688 


Gesamtwabr- 








stihedLnlichkeit 


,0866 


,4477 


,1437 



In dem obenstehenden Feld ist L eine Sprachgruppe und n die 
Anzabl der Sprachgruppen, die durch den Filter 12 nicht 

20 eliminiert wurden. Das Trigranm #VI hat eine 

Walurscheinlichkeit von 0,0679 dafOr, dafi es aus der 
SproidharuppB Li ist, von 0,4659 da£fir, daS es aus der 
Siprachgrxippe Lj ist, imd von 0,2093 dafOr, daS es axis der 
Sprachgnjs)pe Ln ist. Lj wird als die taAchste 

25 Walirscheinlichkeit herausgendttelt und somit ist die Sprach- 
grxjppe identif iziert • 

Die Wahrscheinlictakeit £flr jedes der Trigramme der Graphem- 
Kette (Bingangsname) wird ahnlich dem nrigramm-Analysierer 14 

30 eingegeben. Die Wahrscheinlichkeit fOr jedes Trigransn in ei- 
nem Bingangsnamoi wird £Qr jede $prachgrvgn>e gemittelt. Dies 
gibt die Wahrscheinlichkeit des Eingangsnainens , der von einer 
bestimmten Sprachgruppe staimat, wieder. Die Wahrscheinlich- 
keit, 6a& die Graphem-Kette * VZT&LB # zu einer bestimmten 

35 Spra<fligruppe gefaArt, wird als Vektor von Wahrscheixxlichkeiten 
von der gesamten Wahrscheinlichkeitslinie erzeugt. Aus diesen 
Vektor vm Wafarscheinlichkeiten kdnnen auch andere Grdfien, 
wie zum Beispiel die . Standardabweicfaung und die 
ScfawellenOberprafung, berechnet werden. Dies stellt sicher. 
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dafi eln einzelnes Trigramm «lcht Ober der Geseofttwahrschein- 
lichkelt liegen kann, die Geaamtwahrschelnlichkeit blldet 
Oder verzerrt. 



Obwohl die illustrierte AuB£ChruzigB£orm Trigrasnne analysiert, 
kann der Analysierer 14 kon£iguriert werden, urn imterschied- 
llch lange Gzaphem-Ketfcen, wie zum Belspiel eine Kette mit 
zwei Graphenien Oder vler Graphaoen zu analysieren. 

In dem obenstehendea Belspiel zeigt der Trlgramsi-Axialyslerer 
14, daS die Sprachgn:CTe Lj die wahrsdielxilichste Ursprungs- 
Sprachgruppe £Qr den gegebenen Binggmganamen ist, da sie die 
bOchste Wahrscheinlichkelt hat. Bs ist dlese wahrschein- 
lichste ^rachgruppe, die L TAG ftir den Bingangsnamen wird* 
Das L OiAG Tmd der Bingangsname werden daxm dem Buchstaben-zu- 
iClang-Abschnltt 20 zugesendet, urn die Phoneme £Qr den Bingang 
zu erzeiigoi. Die Flit err egeln sind au£ eine solche Art und 
Weise au£gebaut, daS eine Zweideutigkeit der Identifikation 
nicht ndglich ist. Das heiSt, daS eine Sprache nicht sowohl 
eliminiert als auch posit iv identifiziert werden kann, da eln 
Dominanz-Verhaitnis derart angewendet wird, dafi eine positive 
Xdentlfikation Ober eine Blimlnierungs-Regel bei dem imwahr- 
scheinlidhen Breignis eines Kion£llkts dominiert, 

Ahnlicherweise kann eine Sprachgnippe nicht positiv fOr mehr 
als eine ^prache ideati£iziert werden, da die Filterregeln 
einen geordneten Satz derart bilden, dafi die erste positive 
Zndentifikation angewendet wird. 

Das System kann eine bestimmte Sprachgrvsype 
standardklassi£izieren, wenn eines von zwei Scfawellen- 
Krlterien elngehalten wird: (a) ein absolutes 
Schwellentlberprtl£en trltt au£^ wenn die hAchste 
Wahrscheinlichkeit, die vom Trigranno-Analysierer 14 bestinmt 
wird, unterhalb eines vorgegebenen Scfawellenwerts Ti ist. 
Dies wOrde bedeuten, dafi der nrigramni-Analysierer 14 aus den 
Qprachgr^ppen eine edLnzelne ^rachgrtippe adt eineni 
vemOnftigen Vertrauens-Grad nicht bestimnen kann; (b) eine 
relative ScfawellenwertfUbexprafung tritt au£, wenn der 



Unterschied in den WahrscheinllchJcoicen zwischen der 
Sprachgruppe^ die mlt der hOchsten Wahrscheinlichkeit 
identiflzlert wurde, tmd der Sprachgruppe, die mit der 
zweithAchsten Wahrscheinlichkeit identi£iziert wurde, 
5 unterhalb einea Schwellenwertes Tj failt, wie durch den 
Trigramra-Analysierer 14 bestimnt wird. 




Die StandardklaLssifizieruxig in eine spezifizierte 
Sprachgruppe ist ein setzbarer Parameter. Zum Beispiel ist in 

10 einer Bnglisch sprechenden Tftngebung eine 

Standardklasaif izierung fUr eine englische Anssprache ixn 
allgemeinen der sicherste Weg, da ein Mensch, dem ein 
niedriges Vertrauensniveau gegeben ist, am wahrscheinlichsten 
auf die gattungsgemaSe englische Aussprache des 

IS Bingangsnamens zurOckgreifen wird. Der Wert der 

Standardklassifizienmg als ein setzbarer Parameter besteht 
deurin, daS die Standardklasaifizierung in gewissen 
Situationen, zum Beispiel, wenn die Telefonntimmer anzeigt, 
daS eine Telefonnurwner in einer relativ hoxnogenen ethnischen 

20 Nachbarschaft lokalisiert ist, geAndert werden kann. 



Wie zuvor erwflhnt wurde, werden der Name und das Sprach-Zei- 
dhen (LTA6) , das entweder durch den Filter 12 Oder den Tri- 
gramm-Analysierer 14 zugesendet wird, von dem Buchstabe-zu- 

25 Klang-Regelabschnitt 20 empfiangen. Der Buchstabe-zu-Klang-Re- 
gelabschnitt 20 ist konzeptionell in separate BlQcke fOr jede 
Sprachgruppe aufgeteilt, D,h, , daS die Sprachgruppe (Li) 
ihren eigenen Satz von Buchstabe-zu-Klang-Regeln hat, wie es 
aucOi die Sprachgruppe (Lj ) , die £^rachgnjgn>e (Li^) usw. bis 

30 zur Sfprachgruppe (Ln) haben. 

Uhter der Annahme, daS der Bingangsname ausreichend 
identi£iziert wurde, so dalS eine Standardklassifiziezixngs- 
Aussprache nicht erzeugt wird, wird der Bingangsname zu dem 
as geeigneten Sprachgruppe-Buchstabe-zu-Klang-Block 22£.q gemas 
dem 9prache-Kennzeich«i gesendet, das mit dem Bingangsnamen 
verl^mden ist. 



In dem Buchstabe-zu-Klang-Hegalabsdhnitt 2Q-sjnd die Regeln 
£<Xr die einzelnen Sprachgruppen^-BlOcke 22 Unters&tze eines 
grdSeren iind koinplexeren Satzee aus Buchstabe-zu-Klang-Regeln 
for andere Sprachgrv^pen, eixischlie&lich Bnglisch. Ein 

S Buchstabe-zu-KIang-Block 22^ fOr eine spezifische Sprach- 
gruppe Lj., die ale Urspnings-Sprachgruppe identifiziert 
wurde, versucht« mit der grOSten Graphem-Sequenz £Qr eine Re- 
gel Obereinzustimnen. Dies ist unterschiedlich zu dem Filter 
12, . der von oben nach unten und in dieser Aus fOhrungs form von 

10 rechts xiach linlcs nach der Kette aus Oraphemen in einem 
Eingangsnamen sucht, der eine Filter-Regel erftlllt. Der 
Buchs tabe- zu-Klang-Block 22 ^-j^ fUr eine spezifische Sprache 
tastet die Graphem-Kette von links nach rechts oder von 
rechts nach links ab, wobei die illustrierte AusftOunmgsfoacm 

IS eine Rechts-nach-Linka-Abtastung verwendet« 

Ein Beispiel fOr die Buchatabe-zu-*Klang-Regeln fOr einen ape- 
zifischen Block Lj^ kann fOr einen N^uooen wie zum Beispiel MAN- 
KTEWICZ betrac^tet warden « Dieser Eingangsname wOrde als von 

20 einer slawischen Sprachgnippe staxnnend identifiziert werden, 
die die hOchste Wahrscheinlichkeit hat, und wOrde deshalb zu 
den slawischen Buchstabe-zu-Rlang-Regelblock 22^ gesendet 
warden « Xzi diesoa Block 22^ hat die Graphem-Kette -WXCZ eine 
Ausspracheregel, xjm die korrekten segmentartigen Phcmeme der 

2S Kette bereitzustellen. Die Graphem-Kette -KXEWICZ hat jedoch 
auch eine Regel in dem slawischen Regelsatz. Da dies eine 
langere Graphem-Kette ist/ wQrde diese Regel zuerst angewen- 
det werden. Die segm ent artigen Phoneme fdr alle Qbrigen Gra- 
phemej die nicht einer sprachspezif ischen Ausspracheregel 

30 entsprechoi, werden dann von dem allgemeinen Ausspracheblock 
bestimmfe. in diesem Beispiel wOrdoi die segmentartigen Pho- 
neme fflr Grapheme M, A und N gem&S den allgemeinen Ausspra- 
cheregeln (getrennt) bestimmt werden. Der Buchstabe-zu-Klang- 
Block 22£ sendet die verketteten Phoneme sowohl f{lr die 

3S sprachsensitiven Graphem-Ketten als auch far die nicht- 
spra ch s en aitlven Graphem-Ketten zusamnen der 
Sprachrealisierungseinheit 50 fOr die Ausspradhe zu. 



Der Filter 12 enth&lt nichb^ alle gcoiS^ren Ketten, die sprach- 
spezifisch sind tind die in den Buchstabe-zu-Klang-Regeln 20 
enthalten sind. Die grdSeren Ketten werden nicht alle benO- 
tigt, da zum Beispiel die Kette -WICZ positiv einen Eingangs- 
S xuunen ala vom Ursprung lier slawisch identif izieren wOrde. Es 
besteht dann fOr die Filtexxegel £tlr die Kette ^KXEWICZ keine 
Nbtwendigkeitr da -WXCZ ein Xmtersatz von -KXEWZCZ ist und 
somit den Bingangsxiaixien Identlfizieren wOrde* 

10 Das Buchstabe-zu-Klang-Modiil gibt die Phonero fOr Namen 

haijptsachlich in der Fona von segmentartiger Phonem- Informa- 
tion auis. Der Ausgang dar Buchstabe-zU"-Klang-Regel-B16cke 
22j^.Q di^t als Bingang fOr die Betonungs-Abschnitte 24£^xi* 
Diese Betonungs-Abschnitte 24^.21 nefamen das LTAG zuseutsnen mit 

15 den Phonemen, die durch einzelne Buchstabe-zu-Rlang-Regel- 

B16cke 22^^x1 erzeugt weztien, und gibt eine komplette Phonem- 
Kette aus, die sowobl segmenteurtige Phoneme (von Buchstabe- 
zu-Klang-Regel-Bldcken 22i.n) auch die korrekten 
Betonungsmuater £flr diese Sprache enthalten • ^enn zum Bei- 

20 spiel die Sprache, die fOr den JStamea VXTALB identif iziert 

wurde, Xtalienisch war und der Bachstabe-zu-Klang-Regel-Block 
22 die Phonem-Kette [vitali] liefertr dann wQrde der 
Betonungsabschnitt 24^ die Betonung auf die vorletzte Silbe 
legen, so daS die endgtUtige phonetische Kette [vitali] sein 

25 w(irde« 



Es sollte beachtet werden, daS tatsftchliche Regeln, die in 
dem Filter 12, in dem Buchstabe-zu-Klang-Abschnitt 20 und in 
dem Betonungsabschnitten 24£^2i verwendet werden, Regeln sind, 
30 die entweder bekannt sind Oder einfach von einem Fachinann in 
Linguist ik erhalten werden kfinnen. 



Das oben beschriebene System kann als Frontend-Prozessor fOr 
eine Sprachrealisierxangseinheit 50 betrachtet werden. Die 
35 Sprachrealisierungseinheit 50 kann eine kommerziell erhaitli* 
che BixAeit zum Brzeugen von nenschlicher Sprache aus graphs-* 
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xnlacher uzid phonemischer Bingsbe seiu. -Der 9ytith€:sizer kazin 
auf Ptaonemen basieren oder au£ einer anderen Klangelnheit, 
zxm Belapiel Dlphon cxler Kalbsilbe. Der synthesizer kann auch 
eine andere ^raclie als Englisch synthetisieren. 



Figur 2 zeigt einen Block 60 £tlr Sprachgruppen-Xdentifikation 
und phonebische Realisiertmg als Teil elnes S^teaoB. Der 
Block 60 fOr Sprachgruppen-zdentifikation und phonetisclie 
Realisierxing besteht aus den Funkticnabldckcsn, die in der Fi- 
gur 1 gezeigt warden. Wie gezeigt wird# ist der Bingang £Qr 
den Block 60 ffir Sprachldentifikation und phonetische Reali- 
siening der Name, die Filterregeln und die Trigramm- 
Wahrscheinlichkeiten. Der Ausgang ist der Name, das Sprach- 
Kennzeichen und die Phoneme, die zu der 

j^rachrealisierungseinheit 50 gesendet warden. Es sollte 
beachtet warden, dafi Phoneme in diesen Zusanmienhang irgend 
ein Alphabet aiia Klang-Sfymbolen, einschliefilich Di^ionen und 
Halbsilben, bedeutet. 



Das System gemas der Figur 2 markiert Graphem-Ketten als zu 
einer bestimmten Sprachgruppe zugehdrigf. Der Spracfa- 
Xdentifizierer wird zum Vorfiltem einer neuen Datenbank 
verwendet, urn die W^Oirscheinlichkeits-Tabelle ftlr eine 
bestimmte Datezibank zu verfeinem. Der Analyseblock 62 
eiqpfiangt als BingAnge den Namen und das Sprachkennzeichen und 
Statistiken von dem Block 60 fOr Sprachidenti£ikation und 
phonetische Realisierung, Der Analys^lock Obemixnmt diese 
Xnforxnationen \md gibt den Namen tind das Sprachkennzeichen an 
eine Master-Sprachdatei 64 aus und erzeugt Regeln ftlr einen 
Filterregel-Speicher 68 « Au£ diese Art und Weise wird die 
Dat enbank des systems erweitert, wenn neue Bingangsnamen 
verarbeitet warden, so daS kQn£tige Bingangsnamen ein£acher 
.verarbeitet warden kOnnen« Der Filterregel-Speicher 68 stellt 
die Filterregeln far den Filter 12 und £<lr den Block 60 fOr 
Sprachidenti£ikati<m und phonetische Realisierung bereit. 



Die Master-Datei enthAlt alle Grapfaeoh-Ketten imd ihre Sprach- 
gruppen-Kennzeichen, Dieaer Block 64 wird durch den 
Analyseblock 62 erzeugt« Die Trigramm-Wahrscfaeinlichkeiten 
werden in einer Datenstrtaktur 66 angeordnet, die far die 
5 Einfachheit des Suchens tOr ein gegebenes Eingangs-Trigraznm 
auagelegt ist. Die illustrierte AusfOhningsform verwendet zum 
Beispiel eine N-^tiefe dreidimanaionale ifiatrix, wobei n die 
Anzahl der Sprachgna^en ist. 



10 Trigrainm-Wahrscheinlichkeits-Tabellen werden aua der Master- 
Datei berecbnet, ixidem der nach£olgende Algorittaxnus verwendet 
wird: 



Berechne die Gesamtzahl von AuCtritten jedes TrigramBcns fOr 
IS alle 3prachgruppen (l-N) ; 

fHv alle Graphem-Retten S in L 

for alle Trigramme T in S 

wenn (count [T] [L] » 0) 

uniq [li] s 1 

20 count £T1 [LI + = 1 



FOr alle sidglichen Trigraxmne T im Master 
sum B 0 

£ar alle Sprachgnqppen L 

sum -I- « count [Tl [L] /unia CL] 

tHr alle Sprachgruppen L 
wenn sum >0, problTHL]«count [T][L]/uniq [L]/8um 
azisonsten prob [T] [L] a 0,0; 




Die Trlgrani&r*B)au£i0k6it8tabelle^ die suvor erwdhnt wurde, 
kanzi els dreidimeaaslonales Peld von Trigrasnnen, Spradigrts^pen 
und H&ufigkeiten betrachtet werden. Hftofiigkeiten bedeuten den 

S Prozentsats an Auftreten jener Trlgramoi-Seguensen fOr die 

jewelligen Sprachorunpen auf der Basis einar gxoSen Probe von 
Nteaen« Die Wahrsdheinlichkeit eines Trigramns dafOr, daS es 
ein Tteiln ehmer einer bestimiten Qpradhgruppe ist# kann'auf 
einer Anzahl von Art en abgelltten werden. In dieter 

10 Aus£Qhrunga£orm wird die WahrachelnlicMceit eines Trlgranms 
da£ar, dafi es ein Veilnehxner einer bestiinmten Spracfagruppe 
ist/ von dem gut belcannten 3«^es-*^1ieoresi aus gooAS der Formel 
abgelitten# die unt«isttfiaid arj^gben ists 



IS Die Bayes-Segel sagt, daS die Wahrsch'einlictbkeit , daS Bj bei 
geg^bexiem A auf tritt, P (Bjpl) , gleicfa 
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P(83|A) - -PfA 



«> ^' . lat. 

Genauer fOr das Problem betxftgt die Nolirsdheixilidbkelt fflr 
eine ^radhgrmppe bei gegebenen Trigxaom T gleidh P(Li|T) , 
wobei 

25 



P(IilT) m PfTlLllPfrd> 
Z P(iiI^)P(Ij^ 



weiterhin analysierend 
P<'HLi) » i 



3S 



wobei z m Ansahl# wle oft das zeidhea T in der 
Qpcedbgruppe Li awEtritti 



y a AnzaU. der eiximl5.g aufttreteoEtdeai Zelcdien 
in der sprachgruppe Li 

P(Li) ° — iiinar 



wobel N s die Anzahl der ^rachgruppen (aibht tJberlai^end) 



Die endgaitige Tabelle hat daxm vier Dinensicmezi: eine fOr 
jedes Greq^iem des TrigraBsna und eine ftlr die Sprachgruppe. 

Die Trigraxon-Wabrscheinlicfakeiten werden, wie 'voa dem Block 
66 berecbnet, za dem Block 60 £0r SpracAiidenti£ikation und 
phonetische Realisierung und iziabesondere zu dem Trigranm- 
Analysierer 14 gesendet, der den wahracheinlieihkeitBvektor 
dafOr erzousrt, daS die GbnpiheB»-Rette zu einer beetlmiitea 
Spradhgruppe gebArt. 



Unter Vexwendung des oben beschri^enen Systems kOnnen Namen 
genauer ausgesprodhen warden. Weitere Bntwicklung^i, wie zum 
Beispiel dew Verwenden des Vomamans in Vesfoindung mit dem 
Nactanamen, urn den Kao hn a m e n genauer auszusprechen, sind mit 
zu betradhten. Dies wQrde eine Aosddnumg der existierenden 
Wissens-Bank und der Regels&tze unfassen. 
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» 89 311 83C. 7-2215 

AnsprQche 

5 1. Ver£ahren zxxm positiven Zdentifizieren oder Eli m i n ieren 
elner Sprachgruppe (Lj[..*Lxi) als eine Urspnings-Sprachgnippe 
£€tr ein gegebmes Wort« das au£v«eist: 

Vergleichen vcm XXaterketten aus Graphemai eines Bingangswortes 
mit.eineni geapeicherten Satz von Fllterregeln, bis eatweder 

10 eine Oberelnstimnging einer der Dbterketten ndt einer der 

Filterregeln posltlv eine Sprachgruppe ideziti£iziert Oder bis 
irgendeine Sprachgrx^)pe ellminiert wird, wenn eine 
Obereins 1 1 mmung einer der unterketten mit einer der 
Filterregeln anzeigt, daS eine Sprach.gruppe von der Betracbtung 

15 als eine Ur^rungs-Sprachgruppe £0r das Eingangswort eliminiert 
werdoi kann; und 

Erzeug^ einer Liste nOglicber, nicht eliminierter Ursprimgs- 
Spracbgxuiqpen, wenn keine Sprachgruppe positiv als die 
urspriings-Spracbgruppe identifiziert wird^ Oder 
20 Anzeigen der Ursprirngs- Sprachgruppe ^ wenn die Ursprungs- 
Sprachgnqppe positiv identifiziert wird« 

2* Verfabren, wie in Anspruch 1 beansprucht, wcd^ei der 
Vergleichsscduritt den Scbritt des Durcbisuchens der Filterregeln 
25 von oben nacb unten tmd von rechts nach lixilcs entbait. 

3. Verfaliren/ wie in Ansparuch 1 beansprucht, wobei der 
Vergleichsschritt den Scbritt des Durchsuchens der Filterregeln 
n ac h Sprachgruppe und nach Graphem innerlialb jeder ^rachgzoippe 
30 enthAlt, 

4« Ver£abren zona Brzeugen korrekter Phoneme £ar ein gegebenes 
Eingangswort gem&S einer Sprachgrtgppe von TTrsprftngen des 
Eingangswortes^ wobei das Verfahren aufweist: 
3S Filtem des Bingangswortes in einem Filter (12) , urn eine 

Ursprungs-Sprachgruppe £ar das Eingangswort zu identi£izieren 



Oder urn ginnindeat elne Urspruags-Sfpraclitfruxqpe £Qr das 
Bingangswort z\i eliminieren; 

Senden des Bingangs%rartes imd einer Sprach-Kennzeichmmg , die 
eine Drsprungs-Sprachgruppe fOr das Bingangswort anzeigt, von 
5 dem Filter za einem Buchstabe-zu-Klang-Mbdul (22), der 

Buchstabe-zu-Klang-Regeln enthAlt, wenn der Filter posit iv eine 
Ursprungs-fiEprachgruppe fOr das Bingangswort identifiziert; 
Senden des Bingangswortes und jeder nicht elimi nierten 
Spr^tcOigruppe von dem Filter aus zu einea OraphCTt-Analysierer 
10 (14) , wenn eine Ursprungs-Sprachgrvc)pe fOr das Bingangswort 
nicht positiv dnrch den Filter identifiziert wird; 
Erzeugen einer wahrscheinlichsten Urspnmgs-Spracligruppe ftir 
das Bingangswort, indem Graphenie in dem Bingangswort analysiert 
werden; 

15 SoQiden des Bingangswortes und der wahrscheinlichsten Ursprungs- ' 
Spradhgruppe zu einem Uht ersatz des Buchstabe-zu-Klang-Moduls 
entsprechend der wahrsdheinlichsten Sprachgruppe; 
Brzeugen von seg m e n tartigen Phonemen £ar das Bingangswort in 
dem Untersatz des Buchstabe-zu-iCLang-Mbdiils; 

20 Senden der segment eirtigen Phoneme xind der Sprach-Kennzeichnung 
von dem Buchstabe-zu-Klang-*Uodul zu einem Betonungs- 
Zuordnungsabschnitt (24); 

Brzeugen einer Betonungs-Zuordnungs-Xnformation £tlr das 
Bingangswort in dem Betcmungs-Zuordnungsabschnitt; und 
25 Senden der segmentaartigen Phoneme und der Betonungs-Zuordnungs- 
Information zu einer Sprachrealisierungseinheit (50} • 

5. Verfahren, wie in Anspruch 4 beansprucht, wobei die Grapheme 
Trigramme sind. 

6* Verfahren, wle in Anspruch 4 oder 5 beansprucht, wobei der 
Schritt des Erzeugens einer wahrscheinlichsten Ursprungs- 
^rachgruppe den Schritt des Brmittelns von 

Wahrscheinlichkeiten der Grapheme fte ein Bingangswort, das aus 
15 einer bestinmten Sprachgruppe ist, unter Verwendung der Bayes- 
tegel enthait* 
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7. Verfaliren, wie in Anspruch 4, 5 Oder 6 beanapruchb, das 
weiterhin den Schritt des Binatellena auf eine allgemeine 
Aussprache aufweist, wenn der Schritt des Brzeugens einer 
5 wahrscheinlichsten Ursprungs-Sprachgruppe eine 

walirscheinlichste Ursprungs-Sprachgruppe mit einer 
Wahrscheinlichkeit unterhalb eines vorgegebenen 
ScbMQllenniveaus erzeugt. 

10 8, Verfahren, wie in Anspruch 4, 5, 6 Oder 7 beansprucht, das 
weiterhin den Schritt des Einstellens auf eine allgemeine 
Aussprache aufweist, wenn der Schritt des Erzeugens einer 
wahrscheinlichsten Ursprungs-Sprachgruppe eine 
wahrscheinlic^te Ursprungs-Sprachgruppe mit einer 

IS W^Oirscheinlicfakeit erzeugt, die nicfat grdSer um einen 

bestiranten Wert als eine Wahrscheinlichkeit der ndchsten 
wahrscheinlichsten Ulrsprtmgs-Sprachgruppe ist* 

9, Verfahren, wie in irgendeinem der AnsprOche 4 bis 8 
20 beansprucht/ das ein erstes Durchsuchen eines Verzeichnisses 

(10) nach einem Eintrag entsprechend d^ Eingangswort enthait, 
wobei jeder Eintrag ein Wort und Fhoneiiie ftkr dieses. Wort 
enthait; und 

und ein Senden eines Eintrags zu der a>'rachrealisier\ingseinheit 
25 for die Aussprache enthait, wenn die Verzeichnis-Durchsuchimg 
diesen Eintrag entsprechend den EingangswOrtem ergibt. 

10* Vorrichtung zum positiven Xdentif izieren Oder Eliminieren 
einer Sprachgrun?e (Li...l*a) als eine Ursprungs-Qprachgrxj^pe 
for ein gegeb^oea Wort, die aufweist: 
einen Filterregel-Speicher (68), der einen Satz mit 
Filterregeln speichert, wobei ein erster TOitersatz der 
Filterregeln positiv eine Sprachgruppe identifiziert und wobei 
ein zweiter Satz der Filterregeln eine Sprachgruppe eliminiert; 
einen Vergleicher (12), der TOiterketten der Grapheme eines 
Eingangswortes mit dem ersten Untersatz und dem zweiten 
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as 



tftitersatz der Pilterregeln verglaichc, bis sine tlberelnstiimnung 
elner der Unterketten mit einer dea ersben Untersatzes von 
Pilterregeln positiv eine Sprachgruppe identi£iziert oder eine 
Sprachgruppe eliminiert, wenn eine Obereinstixrammg einer der 

5 Unterketten xoit einer des zweiten Untersatzes der Pilterregeln 
anzeigt/ daS eine ^rachgruppe von der Betrachtung als eine 
Urspznmgs-Spracbgruppe fib: das Eingangswort eliminiert ist; und 
einen Ausgang^ der eine Liste mdglidher Ursprungs-Sprachgn^pen 
erzeugt, wenn keine Sprachgruppe als Ursprungs-Sprachgruppe 

10 positiv identifiziert wird, imd der eine Anzeige der Ursprungs- 
Sprachgruppe erzeugt « wenn die Ursprungs-Spracligzrxqppe positiv 
identifiziert wird* 



11. Vorrichtung, wie in Jknapruch 10 beansprucht^ die einen 
15 Analysierer (14) zum Berechnen der wahrscheinlichsten 

Ursprungs-*S^rachgnippe fOr die Grajdieme/ die von dem Ausgang 
aus empfangen werden, in den gegebenen Wort fOr jede Sprache 
enth&lt/ die nicht durch den zweiten Ibtersatz der 
Pilterregeln, elixniniert wird. 

70 

12. Vorrichtung, wie in Anspruch 11 beansprucht, in der der 
Analysierer Grapheme in dem gegebezian Wbrt analysiert, die in 
Trigramoien angeordnet sind. 
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